- АНАЛИЗ СОЦИАЛЬНЫХ СЕТЕЙ
- - методология и методы исследования связей между социальными акторами. Возникновение этой методологии относят либо к 1930-м, когда в психологии оформился социометрический подход, либо к 1950-м, когда для анализа ранних описательных исследований были применены матричная алгебра и теория графов.
Предметом А.С.С. является структура - повторяющиеся, регулярные паттерны отношений. Математический аппарат А.С.С. позволяет исследовать реляционные данные, свойства связей и отношений, хотя атрибутивные данные также могут быть включены в анализ. Другой важной особенностью является возможность одновременно использовать в анализе данные разного уровня: особенности акторов, подгрупп акторов, позиций и целой сети. С самого начала А.С.С. был междисциплинарным мероприятием и объединял усилия психологов, социологов, специалистов по коммуникациям, антропологов, математиков и статистиков. В 1978 была образована Международная ассоциация специалистов по А.С.С. (INSNA), учрежден журнал "Social Networks". В Интернете доступны другие издания по А.С.С. - электронные журналы "Connections" и "Journal of Social Structure". Методология исследования сетей оказывает существенное влияние на компьютерные науки, менеджмент, социальную медицину, молекулярную биологию.
С. Вассерман и Ф. Паттисон условно выделяют три поколения в А.С.С. Основными темами исследований первого поколения (до 1970-х) были квантификация положения индивида в группе; анализ сплоченных подгрупп; структурный анализ сбалансированных диадических и триадических отношений; идентификация позиций - структурно неразличимых подгрупп, т. е. индивидов, имеющих одинаковые закономерности связей с другими. Хотя попытка статистического исследования связей в социоматрице была предпринята уже Морено и Дженнингс (1939), развитие статистических методов сдерживалось тем обстоятельством, что связи между парами акторов в социальной сети не являются взаимно независимыми, и по этой причине использование традиционных формул для расчета стандартных ошибок, необходимых для проверки статистических гипотез, неправомерно. Второе поколение зародилось в 1970-х с разработки П. Холландом, С. Линардом и другими статистических моделей, параметрически оценивающих вероятности отношений в небольших группах. Эти модели строились на предположениях о независимости диадических связей. Третье поколение моделей появилось на свет в конце 1980-х - начале 1990-х и основывалось на идее марковских случайных графов. Эти наиболее общие модели свободны от предположения о независимости диад и позволяют проверять статистические гипотезы о сплоченных подгруппах, транзитивных триадах, взаимосвязанных диадах, о влиянии индивидуальных характеристик на групповую структуру. Ниже представлены наиболее популярные методы описательного, нестатистического анализа сетей. Методы А.С.С., относящиеся ко второму и третьему поколениям, Стохастический анализ социальных сетей.
Элементарные понятия А.С.С. Данные о связях акторов представляются в виде социоматрицы - квадратной или прямоугольной таблицы, элементы которой равны показателю силы связи, исходящей от актора в i-й строке к актору в j-м столбце. Всякой социоматрице может быть взаимно однозначно сопоставлен орграф. Графом называется множество вершин и связей между ними. Связи могут быть ненаправленными (ребра) и направленными (дуги). Граф с заданными на нем дугами называется ориентированным, или орграфом. Вершины, соединенные ребром, являются смежными. Степенью вершины называется число ребер, соединенные с ней. Исходящей степенью вершины называется число дуг, исходящих из вершины, входящей степенью - число дуг, входящих в вершину. Последовательность вершин, соединенных ребрами, составляет цепь. В цепи направление связей между вершинами не имеет значения. В простой цепи ни одна из вершин и ни одно из ребер не повторяются. Число ребер цепи называется ее длиной. Длина самой короткой цепи, связывающей две вершины, называется расстоянием между вершинами (без учета направления связей). Последовательность вершин, соединенных дугами, называется путем (направление связей существенно). В простом пути ни одна из вершин и ни одна из дуг не повторяются. Число дуг, составляющих путь, называется его длиной. Длину самого короткого пути, связывающего две вершины, называют расстоянием между ними (с учетом направления связей). Орграф, в котором из каждой вершины существует путь к любой другой вершине, называется сильно связным (путешествовать можно лишь по направлению дуг). Орграф, в котором существует цепь из каждой вершины к любой другой, называется слабо связным (можно путешествовать против направления дуг). Плотность графа есть отношение числа наличных связей к потенциально возможному. В графе и социоматрице различают дихотомические и взвешенные, означенные и неозначенные связи. Для простоты последующее изложение основных методов А.С.С. касается социоматриц с дихотомическими неозначенными связями, хотя во многих случаях возможны обобщения на более сложные ситуации.
Индивидуальные и групповые показатели заметности. Идея центральности вершин в графе, их "важности" начала разрабатываться одной из первых в анализе социальных сетей. Источник этой идеи можно усмотреть в мореновском понятии "звезды" - самого популярного человека в группе. Будем называть меру заметности актора в сети (неориентированном графе) центральностью, для входящих связей в орграфе - престижем, для исходящих связей - экспансивностью.
Простой и интуитивно понятный подход к измерению центральности индивидов основывается на идее степени. Для сопоставимости индексы нормируют, т. е. делят на максимально возможное количество связей (n-1) и умножают на 100. Полученные значения лежат в пределах от 0 до 100. Формулы для центральности, престижа и экспансивности по степени различаются числителями, которые содержат соответственно степень вершины, степень входа и степень выхода. Степени входа (выхода) получают суммированием элементов социоматрицы по столбцу (строке). Индексы центральности по степени являются локальными характеристиками положения вершины в графе - они учитывают непосредственных соседей, ближайшую окрестность вершины и в этом смысле поверхностны.
Вторая группа показателей центральности (престижа, экспансивности) основана на идее близости данной вершины ко всем остальным вершинам графа. Центральным является тот индивид, который быстро взаимодействует с другими либо непосредственно, либо через небольшое число посредников. Г. Сабидуси в 1966 году квантифицировал эту характеристику как величину, обратную сумме длин самых коротких путей от данного индивида ко всем остальным. Индекс равен 100, если вершина смежна со всеми другими. Возможная физическая интерпретация близости - ожидаемое время движения ресурса от любого участника сети к данному индивиду. Центральность по близости является глобальной мерой сети. Недостаток показателя в том, что он не определен для изолированных вершин, поскольку при отсутствии связи между вершинами расстояние между ними бесконечно.
Взаимодействие двух несмежных индивидов может находится под контролем возможных посредников. При поисках работы, например, важно не то, сколько знакомых у претендента, а сколько знакомых у этих знакомых. Метод оценки центральности по посредничеству для вершины предложен Л. Фриманом в 1977 и заключается в нахождении доли самых коротких путей, соединяющих все пары вершин, которые проходят через данную вершину. Это сумма вероятностей того, что другие акторы в своих взаимодействиях будут прибегать к посредничеству данного актора. Показатель стандартизуется делением на максимально возможную величину - (n-1)(n-2)/2. Центральность по посредничеству является глобальной характеристикой вершины и имеет более интересную интерпретацию, чем другие индексы центральности. Показатель определен на несвязных графах, хотя индексы для экспансивности и престижа не определены. Показатель учитывает лишь кратчайшие пути от вершины к вершине и основан на предположении, что при наличии между двумя вершинами нескольких коротких путей равной длины каждый из них используется с равной вероятностью. Эти ограничения снимаются в поточных индексах.
Индекс поточного посредничества предложен как обобщение предыдущего показателя, чтобы учесть все потоки, проходящие через вершину, независимо от их длины (Л. Фриман). Индекс информационной центральности оценивает распределение информации во всех цепях графа, взвешивая цепи величиной, обратной их длине (К. Стивенсон, М. Зелен). В индексе Боначича (собственный вектор социоматрицы, нормированный делением на первое собственное значение) центральность актора определяется как взвешенная сумма центральностей акторов, которые с ним связаны, а эти центральности - как взвешенные суммы центральностей тех акторов, которые связаны с ними, и т. д. Более сложные варианты индексов, основанные на собственных векторах, получают стандартизацией социоматрицы по определенным правилам.
Показатели центральности, основанные на степени, информационно бедны. Центральность по посредничеству и поточные индексы предпочтительны в силу того, что они имеют большую изменчивость значений и более интересную интерпретацию. Для более точной оценки значимости индивида в группе рекомендуется сравнивать показатели участников сети до и после удаления индивида с наибольшим значением индекса центральности по посредничеству. Н. Фредкин полагает, что центральность по степени отражает влияние данного индивида на других, центральность по близости - скорость распространения этого влияния, а центральность по посредничеству - контролирующую, посредническую роль в этом процессе. В литературе показатели центральности интерпретируются как индикаторы власти.
Групповые показатели центральности являются мерами изменчивости или неравенства индивидуальных показателей в графе. В таком общем понимании групповые индексы по смыслу близки дисперсии (мере разброса). По причинам математического свойства наиболее популярны групповые индексы Фримана по степени, близости или посредничеству. Каждый из этих показателей равен сумме отклонений индивидуальных показателей от максимального наблюдаемого, отнесенной к теоретически возможному максимуму сумм отклонений. Знаменатель получают аналитически. Групповые индексы равны нулю в том случае, когда все индивидуальные показатели равны, и 100, если в графе доминирует одна вершина. В отличие от дисперсии, групповые индексы не зависят от размера графа.
Анализ сплоченных подгрупп. Сплоченность принадлежит к числу основных характеристик социальных групп. В широком смысле она понимается как единство, общность норм и интересов, взаимные симпатии членов группы. Основными индикаторами сплоченности в А.С.С. выступают взаимность и частота контактов акторов, близость и достижимость вершин графа. В разумно больших сетях обычно обнаруживают несколько пересекающихся сплоченных подгрупп. Для аналитика интерес представляют количество, состав, размер, а также степень взаимного пересечения подгрупп. Большинство методов этого раздела разработаны для ненаправленных дихотомических связей, и компьютерные программы анализа сетей приводят социоматрицы к симметричному виду.
Простейшим методом анализа сплоченных подгрупп является идентификация клик. В терминах теории графов это максимальный полный подграф, включающий не менее трех вершин. По определению, все вершины клики связаны между собой, и при добавлении любой другой вершины это свойство теряется. Следует иметь в виду, что в отечественной социальной психологии закрепилось определение клики как сплоченной асоциальной группировки. Понятие клики является чрезмерно строгим, а полученные подмножества акторов неустойчивы: удаление или случайное отсутствие одной связи разрушает клику. Чтобы ослабить это ограничение, были разработаны другие меры сплоченности подгрупп. Они основаны либо на понятии достижимости вершин в подграфе, либо на степени вершины (смежность с другими).
Клика порядка n (n-клика) определена как максимальный подграф, в котором наибольшее расстояние между вершинами не превышает заданной величины n. Основным недостатком этого подхода является то, что наикратчайшие пути между членами n-клики могут проходить через посредников, которые сами не принадлежат сплоченной подгруппе. Это обстоятельство может создавать трудности в интерпретации результатов. Скорректированное понятие называется кланом порядка n. Кланы получают исключением из найденных n-клик подгрупп с диметром (наибольшим из самых коротких расстояний между вершинами), превышающим заданное n. Алгоритм поиска клик и кланов заданного порядка обычно приводит к большим подгруппам.
Понятия k-плекса и k-ядра основаны на идее степени вершины, или меры ее смежности с другими. k-плекс - это максимальный подграф с n вершинами, такой, что каждая вершина связана не менее чем с n-k вершинами этого же подграфа. Другими словами, задается максимальное количество связей между членами подгруппы, которое может отсутствовать. Ядро порядка k определяется как максимальный подграф с n вершинами, в котором каждая вершина смежна, как минимум, с k другими вершинами. Здесь задается минимальное количество связей, которое должно присутствовать в подгруппе. Оба метода дают более реалистичную картину сплоченных подгрупп относительно небольшого размера и устойчивы к случайному отсутствию связей.
Логика следующей группы методов связана со сравнением характера связей акторов внутри подгруппы и с "внешними" акторами. LS-множество определяется как подграф, плотность связей между вершинами которого больше, чем плотность связей этих вершин с другими, не входящими в подграф. LS-множества либо не пересекаются, либо связаны отношениями включения. Другой подход к описанию сплоченных подгрупп, лямбда-множество, основан на идее связности вершин внутри и вне подграфа; вершины подграфа не обязательно смежны. Оба метода дают устойчивые и хорошо интерпретируемые результаты.
Из числа общестатистических методов для анализа сплоченных подгрупп используют многомерное шкалирование, которое позволяют представлять изучаемые объекты в пространстве меньшей размерности. Подгруппы объектов, соседствующие в этом редуцированном пространстве, интерпретируются как сплоченные подгруппы.
Позиционный и ролевой анализ. Рассмотренные выше методы А.С.С. основаны на простых понятиях, которые могут быть визуализированы на графах. Методы, представленные в этом разделе, более абстрактны. С точки зрения структурного аналитика, элементами социальной структуры являются не акторы, а регулярности отношений между ними - социальные позиции и роли. Актор выступает не в своем индивидуальном качестве, а как представитель категории (лидер, посредник, подчиненный, владелец и т. д.). Позиция в А.С.С. определяется как множество неразличимых акторов, имеющих сходные отношения в сети, роль - как тип отношений между акторами и/или позициями.
Позиционный анализ включает следующие шаги: формальное определение эквивалентности акторов, выбор способа измерения эквивалентности, конструирование модели (правил отнесения акторов к взаимоисключающим позициям и уточнение связей между позициями), оценка адекватности модели полученным данным. Центральным понятием является эквивалентность акторов внутри позиции. Простейшая идея связана со структурной эквивалентностью (Ф. Лорейн и Г. Уайт, 1971). Нестрого, два актора являются структурно эквивалентными, если они имеют одинаковые отношения со всеми другими элементами сети. Это определение существенно ограничивает возможности анализа. Например, с точки зрения социологии (и родительских комитетов общеобразовательных школ), все родители занимают одну и ту социальную позицию, однако структурно эквивалентными будут только родители одних и тех же детей. Вот почему обычно измеряют не наличие/отсутствие структурной эквивалентности, а ее меру. В этом качестве может выступать евклидово расстояние или коэффициент корреляции между парами акторов в многомерном пространстве диадических связей полной сети. Для представления (визуализации) позиций и отношений между позициями используют иерархический кластерный анализ или многомерное шкалирование.
Определение структурной эквивалентности запрещает сравнение позиций в разных сетях. Понятие регулярной эквивалентности более универсально. Два актора регулярно эквиваленты, если они имеют одинаковые связи с другими регулярно эквивалентными акторами. В отличие от структурной эквивалентности, все отцы регулярно эквиваленты, поскольку их социальные связи со своими детьми, женами и родителями жены весьма сходны.
Большую популярность в А.С.С. получил более общий подход к позиционному анализу - т. н. блочное моделирование отношений. Блочная модель включает два компонента: разделение акторов на позиции и спецификация связей между всеми позициями. Цель состоит в том, чтобы "свести большую, потенциально некогерентную структуру к меньшей структуре, более понятной и легко интерпретируемой" (А. Ферлигой). Результаты моделирования представляются в виде редуцированного графа или матрицы образов, где каждой вершине или каждому элементу матрицы соответствует не единичный актор, а блок (класс акторов). Блоки бывают двух типов: нулевые (связей скорее нет) и единичные (связи скорее есть). Структурная эквивалентность предполагает следующий критерий для различения нулевых и единичных блоков: если связи между любой парой акторов внутри блока отсутствуют, он кодируется как нулевой; если между всеми парами акторов связи наличествуют, блок является единичным. Сформулированы более гибкие критерии, например, если плотность связей внутри блока превышает плотность связей в полной сети, он кодируется как единичный. П. Дореан, А. Ферлигой и В. Батагель предложили набор идеальных блоков, который отличает значительная реалистичность, универсальность и эмпирическая проверяемость. Предложены простые критерии оценки соответствия блочных моделей полученным данным. Используют как индуктивный (правдоподобные блоки идентифицируются в данных), так и дедуктивный подходы (блоки задаются исследователем априорно и проверяются на данных). Более сложные стохастические методы блочного моделирования Стохастический анализ социальных сетей.
Цель ролевого анализа - идентифицировать на множестве акторов, связанных множественными простыми связями, закономерности отношений (С. Бурман, Г. Уайт). Анализ основан на аппарате алгебры отношений. В качестве простых связей могут использоваться измерения с помощью набора социометрических критериев, различные связи в родственных или организационных сетях (совет, помощь, подчинение, контроль, стратегическое управление). Смешанные связи конструируются из простых с помощью булевой алгебры (совет подчиненному, брат жены, друг друга и т. п.). Конечной целью является редукция к гомоморфным и легко интерпретируемым структурам, на которых можно изучать сочетаемость и подчиненность отношений. Развивается аппарат эго-алгебры, позволяющий исследовать социальные роли в эго-сетях с точки зрения эго.
Компьютерные программы А.С.С. На рынке представлено множество компьютерных программ для сбора и ввода данных, описательного и статистического анализа. Программа UCINET (S. Borgatti, M. Everett, L. Freeman) является своего рода стандартом для специалистов в области А.С.С. Версии программы часто обновляются. К моменту верстки настоящего словаря доступна версия 6, включающая все основные методы анализа, за вычетом p*-моделей, и средства преобразования данных. Предыдущие версии программы свободно доступны через Интернет, однако содержат немало ошибок в алгоритмах расчетов.
Программа Pajek (V. Batagelj, A. Mrvar) предназначена для анализа больших сетей (с тысячами вершин). Ее привлекательными свойствами являются богатые средства визуализации сетей, возможности преобразования данных, поддержка разных форматов графических и текстовых файлов, оперативное появление новых версий и свободный доступ через Интернет для некоммерческого использования.
STOCNET (P. Boer, M. Huisman, T. Snijders, E. Zeggelink) содержит весьма сложные методы анализа повторяющихся измерений, стохастического блочного моделирования и стохастического анализа сетей (p*-модели). Свободно доступна в Интернете.
Другими программами, популярными в научной литературе, являются GRADAP (C. Sprenger, F. Stokman), NEGOPY (W. Richards), MultiNet (W. Richards). Имеются специализированные программы, содержащие небольшое количество методов анализа (SNAPS, STRUCTURE, PSPAR и др.), предназначенные для визуализации сетей (Mage), разработанные для сбора данных в антропологических исследованиях или в компьютерных сетях и др. Ряд специфических методов А.С.С. реализован в командных файлах, написанных для стандартных программ статистического анализа (SPSS, SAS).
С.В. Сивуха
Социология: Энциклопедия. — Минск: Интерпрессервис; Книжный Дом. А.А. Грицанов, В.Л. Абушенко, Г.М. Евелькин, Г.Н. Соколова, О.В. Терещенко. 2003.